Reportes anteriores: https://github.com/clbustos/analisis_covid19_chile

Recuerde leer la encuesta diaria realidad nacional de la SOCHIMI al 19 de Mayo.

Análisis de series de casos

Serie total

La serie de casos se hace hace partir de los 25 casos, excepto para Aysén - donde solo hay 8 casos desde hace 10 días, para facilitar la comparación desde un punto de un punto de partida común.

Si vemos la serie total, podemos ver que la tasa de incremento diario prácticamente se ha mantenido constante en los últimos 20 días. Si observamos las curvas por zonas geográficas del país, podemos observar lo siguiente:

  • Zona Norte: Antofagasta mantiene su tasa de aceleración constante por cerca de 10 dias. Tarapaca se muestra un ritmo de aceleración constante desde hace 20 días, separándose de su patrón muy similar a Tarapacá. Arica y Parinacota comienza a acelerarse en los últimos 4 días. Atacama muestra un ritmo constante, relativamente bajo, desde hace 11 días. Coquimbo se muestra en un ritmo acelerado desde hace dos semanas.
  • Zona Central. La Región Metropolitana parece mantener la misma tasa de crecimiento hace aproximadamente un mes. Valparaíso sigue manteniendo una curva de aceleración progresiva durante el mismo periodo. Ñuble y Maule muestran aceleración durante la última semana. O’Higgins en las últimas tres semanas muestra una progresiva aceleración.
  • Zona Sur: Biobío muestra un ritmo estable de incremento de casos desde hace 2 semanas, superior al periodo previo. Los Ríos se muestra acelerado hace una semana. El resto de las regiones se ve relativamente estable
  • Zona Austral: Se grafica solo a Magallanes, ya que Aysén presenta menos de 25 casos. Se observa muy desacelerado en los últimos 10 días.

Con respecto a la tasa de casos totales del día vs del dia anterior, como se detecta un ciclo semanal bastante claro, se procedió a cambiar la estimación de la tendencia usando el método STL, que elimina el componente periódico, para poder mostrar los datos en bruto y una tendencia más responsiva a los cambios intrasemanales. Se puede apreciar como la la mayoría de las regiones vuelve a presentar aumentos en la tasa de casos totales de un día vs el precedente, excepto Magallanes y Aysén.

Una forma de visualizar rápidamente el cambio es calcular la tasa de incremento diario usando regresión sobre los logs de los casos de la semana pasada vs la actual. Una tasa de 1 indica que tenemos los mismos casos de un día a otro, que es el caso de Aysén. Si se traza una línea en la diagonal, cualquier región que quede sobre esta línea está más acelerada en la última semana que en la anterior. Al día de hoy, podemos ver que se empiezan a observar desaceleraciones en Los Lagos, Atacama, Antofagasta, Valparaíso y O’Higgins.

Casos nuevos

Se puede apreciar que la serie total en los últimos dos días se encuentra cerca de los 4000 casos nuevos por día.

Usando escala logarítmica en el eje Y, se puede apreciar con mayor claridad el ciclo de 7 días alrededor de la tendencia, y como esta no ha variado prácticamente en nada los últimos 10 días.

Si observamos la evolución en el resto de las regiones, podemos distinguir tres tipos de patrones. Debo aclarar que la clasificación cambia de acuerdo a la mayor cantidad de información disponible. Por ejemplo, un aparente descenso puede terminar simplemente siendo una fluctuación menor sobre una tendecia ascendente.

  • Acelerados: progresivo aumento de los número de casos, sin peak evidente. Metropolitana, Antofagasta, Tacapacá, O’Higgins, Valparaíso.
  • Mitigación de ciclo único: Se observa un claro peak con descenso posterior. Magallanes, Atacama y Los Lagos (posible paso a migitación incompleta).
  • Mitigación incompleta con ciclo múltiple: Se presentan ciclos de aumento y decremento, que no permiten determinar un claro descenso de la curva. Coquimbo, Biobío, Maule, Araucanía, Los Ríos y Ñuble, Arica y Parinacota.

Usando la tasa de casos nuevos diarios vs los del día anterior, se puede que Valparaíso , Metropolitana, Biobío, Tarapacá yla Araucanía lentamente están estabilizando la aceleración, a niveles levemente sobre 1. Ñuble, Maule y Antofagasta presentan oscilaciones aun muy fuertes por día.

Predicción

Predicción para serie total

Para la predicción total se recorta la serie a partir de lo 50 casos.

  • tendencia sobre casos nuevos + AR(1) y sobre AR(4): Se modela la tendencia de los casos nuevos usando regresión exponencial, con regresión cuadradática, más la relación que existe entre mediciones contiguas. Se prueban dos modelos, uno que considera la relación solo entre cada tiempo y el anterior, AR(1), y un modelo más a largo plazo, que considera periodos de 4 días consecutivos, AR(4) . El error estándar aumenta a lo largo del tiempo, tanto por el error al calcular la tendencia, como por el componente autorregresivo. El valor medio obtenido es bastante sensible a los cambios en las mediciones finales.
  • Modelo lineal cuadrático: Un modelo muy sencillo es modelar los casos totales con $ y= + _1 * dia + _2 * dia^2$, usando autocorrelación AR(1). Si bien en las pruebas muestra tener un intervalo de confianza malo y sobreestimar, tiende a tener menor error cuadrático bajo procesos estables. El día de hoy se elimina, porque no converge.

Si observamos la predicción realizada hace 7 día, podemos ver que nuevamente T+AR(4) se acerca más al resultado observado que T+AR(1).

  casos li ls
Observado 69102 NA NA
Casos nuevos : Tendencia + AR(1) 58661 50331 77734
Casos nuevos: Tendencia + AR(4) 58136 50445 75108

En una semana más los modelos predicen entre 81861 y 85712 casos.

## Scale for 'y' is already present. Adding another scale for 'y', which will
## replace the existing scale.

Casos nuevos: tendencia + AR(4) : total
  dia casos li ls
72 83 72581 71065 75268
73 84 76288 73077 82097
74 85 79873 74745 89800
75 86 83647 76470 98059
76 87 87355 78053 106750
77 88 91224 79688 115902
78 89 95068 81259 125305
Casos nuevos: tendencia + AR(1) : total
  dia casos li ls
72 83 72758 71010 76107
73 84 76427 72695 84100
74 85 80153 74322 92628
75 86 83965 75953 101535
76 87 87883 77615 110772
77 88 91923 79323 120331
78 89 96095 81083 130221

Predicciones para serie total usando predicción por regiones.

Otro modelo posible de análisis es usar la suma de las predicciones parciales por región. No he calculado los intervalos de confianza, porque para que sean adecuados debería considerar la covarianza entre las series de las distintas regiones.

El modelo cuadrático predice muchos menos casos (73697), que los modelos de tendencia AR(1) y AR(4), con 93293 y 93226 casos, respectivamente.

Table continues below
fecha Casos nuevo: Tendencia + AR(1) Casos nuevo: Tendencia + AR(4)
2020-05-24 73715 73534
2020-05-25 78853 78457
2020-05-26 84470 84022
2020-05-27 90594 90134
2020-05-28 97272 96789
2020-05-29 104563 104024
2020-05-30 112530 111866
General: Cuadrático + AR(1)
71684
74313
76987
79707
82473
85284
88142

Ventiladores y Casos en UCI

El total de ventiladores ocupados muestra una máxima en la serie, con 1798 casos. Si bien hace 5 días se incorporaron 218 ventiladores, el aumento en 300 casos en el mismo periodo hace que la cantidad de ventiladores disponibles vuelva nuevamente a un mínimo de 332.

Uso de ventiladores última semana
fecha total disponibles ocupados
2020-05-18 2130 526 1604
2020-05-19 2130 455 1675
2020-05-20 2130 390 1740
2020-05-21 2130 332 1798
2020-05-22 2177 346 1831
2020-05-23 2250 336 1914
2020-05-24 2318 348 1970

Si analizamos la serie total de pacientes en UCI para Covid-19, se observa también un máximo con 943 casos.

Uso de camas UCI Covid-19
fecha total
2020-05-18 807
2020-05-19 876
2020-05-20 904
2020-05-21 943
2020-05-22 986
2020-05-23 1062
2020-05-24 1090

Al analizar la serie por regiones, el fuerte incremento en camas UCI se puede atribuir, como ha sido la tónica durante los últimos 22 días, a la Región Metropolitana. Recordemos que la ocupación de camas por sector se encuentra entre 93% y 99%, por lo que la utilización de camas solo podrá aumentar si aumentan los cupos.

En las otras regiones, destaca que las camas utilizadas en Antofagasta está a punto de superar el máximo que tenía la Araucanía; aun se encuentra en 84% de capacidad. Le sigue de forma cercana Valparaíso, que se encuentra a 75% de capacidad.

Decesos

Si observamos la serie de decesos por día, desde los 4 casos (se excluye Tarapacá y Coquimbo), se observa un incremento importante en los últimos 9 días.

Si analizamos la tasa de decesos diarios, podemos ver que hoy supera los 40 casos diarios.

Modelo dinámico linear de decesos basado en casos

Simplificaremos el modelo de decesos basados en casos, utilizando directamente el número de decesos contra el de casos. En las pruebas realizadas se puede observar que es necesario incrementar hasta el log 22 para llegar a resultados más fiables. Se puede ver que la predicción se basa fundamentalmente en los días con alto número de decesos, aunque es relativamente lineal en el rango inferior a 15 casos.

coeficientes
  Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.181 0.725 -0.249 0.805
L(chile.decesos.ts) 0.478 0.183 2.617 0.013
L(chile.casos.ts, 0:22)0 -0.002 0.002 -0.627 0.535
L(chile.casos.ts, 0:22)1 0.008 0.003 2.539 0.016
L(chile.casos.ts, 0:22)2 -0.003 0.003 -0.774 0.444
L(chile.casos.ts, 0:22)3 -0.001 0.003 -0.359 0.722
L(chile.casos.ts, 0:22)4 0 0.003 -0.129 0.898
L(chile.casos.ts, 0:22)5 -0.002 0.004 -0.484 0.632
L(chile.casos.ts, 0:22)6 -0.001 0.004 -0.228 0.821
L(chile.casos.ts, 0:22)7 0.001 0.004 0.174 0.863
L(chile.casos.ts, 0:22)8 0 0.004 0.1 0.921
L(chile.casos.ts, 0:22)9 -0.004 0.005 -0.791 0.434
L(chile.casos.ts, 0:22)10 0.008 0.005 1.636 0.111
L(chile.casos.ts, 0:22)11 -0.004 0.005 -0.75 0.459
L(chile.casos.ts, 0:22)12 0.006 0.007 0.826 0.414
L(chile.casos.ts, 0:22)13 -0.008 0.007 -1.076 0.289
L(chile.casos.ts, 0:22)14 0.012 0.009 1.349 0.186
L(chile.casos.ts, 0:22)15 -0.003 0.009 -0.347 0.731
L(chile.casos.ts, 0:22)16 0.007 0.009 0.781 0.44
L(chile.casos.ts, 0:22)17 0.002 0.008 0.188 0.852
L(chile.casos.ts, 0:22)18 -0.001 0.008 -0.168 0.867
L(chile.casos.ts, 0:22)19 0.005 0.008 0.63 0.533
L(chile.casos.ts, 0:22)20 -0.005 0.008 -0.561 0.578
L(chile.casos.ts, 0:22)21 -0.001 0.008 -0.064 0.949
L(chile.casos.ts, 0:22)22 -0.004 0.008 -0.451 0.655
R² Ajustado
0.9278

Análisis de Benford

Es sabido que diversas distribuciones de datos en los cuales se mezclan distintas subpoblaciones siguen la ley de Benford. Esta señala que los primeros dígitos de cada número presentan una distribución previsible. Existen extensiones como la distribución de segundo orden, que señalan que la diferencia entre los valores ordenados de la serie también sigue la ley de Benford. Se discute si la sumatoria de todas las cifras que comienzan con 1, 2… siguen una distribución uniforme o una Benford

En general, podemos ver que hay un exceso de 1 y déficit de 4, 6 y 7 en el análisis general, al igual que la última semana.

Para la serie de decesos, se mantiene el exceso de cifras con 1. No hay suficientes casos para revisar la distribución de segundo orden.

Fuentes de información: Principalmente, se utilizó el reporte diario del MINSAL, usando Wayback machine para recopilar la información ya no disponible. También se ocupa la nueva serie disponible en el Github del Ministerio de Ciencias.